-
Notifications
You must be signed in to change notification settings - Fork 5.1k
推理部分,增加gradio的wav音频流式输出演示 #448
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
base: fast_inference_
Are you sure you want to change the base?
Conversation
合入最新main的代码 |
请问您所使用的gradio版本是多少的?我看audio控件没有声明streaming=True,我用这个分支跑了一下,并没有流式输出的效果。 |
启动这个WebUI包装: ps: 我用的是MacOS录屏没有声音,晚点用Windows验证下。可以用example里长一些的文本,实测Mac需要差不多两句后才开始自动播放 |
感谢,我用mac os试下,非常赞的一边推理一边播放的流式效果 |
手边没有windows的机器,晚点我验证完,等主干稳定后再push一版。也可以看看有没有其他要调整的CR点 |
我这俩天用macos测试官方的demo:https://huggingface.co/spaces/gradio/stream_audio_out 还是没有效果,很怪异 2.20.mp4 |
你试试 stream as file 后,点击播放按钮试试。看他代码没有加自动播放 |
期待大佬的视频效果。如果有流式以及非流式的对比就更好了 |
可以了,应该是浏览器版本问题导致的,对浏览器版本要求比较特别,Windows还是不支持 |
是的。最开始调这个时,发现Chrome Windows版本对音频自动播放做了限制,得单独打开 |
重新合并了下上游的变更:
|
请问如何验证效果, 代码已经同步 |
这个功能感觉很有用 |
验证了下,Windows下gradio的streaming确实有问题,这个是测试页面: https://huggingface.co/spaces/gradio/stream_audio_out 测试了Chrome 122.0和Edge,无论推文件还是Bytes都无法正常播放。可能需要换个其他的wave控件 |
Windows下目前只能用API模式,运行方法: python GPT_SoVITS/inference_stream.py --api
# 访问 http://localhost:5000?text=<测试文本> Windows下流式推理录屏(Chrome不会自动播放,需要等推理完2句后点下播放): win_streaming.mp4补充:Gradio的音频控件,Windows下设置 |
这个应该是切分了句子之后,按句子级别进行输出的流式? |
对,默认用的是按标点符号切割。 新的 如果不是MacOS推理,Windows目前会因为gradio的Audio请求一直挂起(直到推理结束),因此暂时只能在API模式下实现视频里流式播放效果。 |
好的,已经看到流式推理的效果了 |
您好,请问如何在服务器上部署流式API,我直接使用stream_api.py,会无报错: Traceback (most recent call last): |
没有遇到过类似情况,是最新分支吗?我晚点测试看看 记得代码里每个batch,推理音频后会附加一个zero_wav用于停顿,你可以去掉试试: |
merge了 |
感谢大佬,已经解决 |
这个能不能不按照逗号切分,而是真的流式,比如输出一个token变成音频,之后继续推理输出token到音频。。。。。 |
新年快乐!
看到 #291 的issue,之前有过一个类似代码,于是今天参考GUI写了个流式输出的demo。
对
inference_webui.py
有2处改动:get_tts_wav
增加一个stream参数(默认False不影响原逻辑),开启后按text推理bytes的结果;if __name__ == '__main__':
避免从inference_webui.py
引用函数时启动gradio app;